ارائه راهکاری نوین برای انتخاب داده ها در الگوریتم های یادگیری مبتنی بر نمونه
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر
- نویسنده محمد جناب
- استاد راهنما منصور ذوالقدری جهرمی علی حمزه
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1392
چکیده
الگوریتم نزدیکترین همسایه یکی از قدیمی ترین و ساده ترین روشهای غیر پارامتریک و پویای دسته بندی است. این الگوریتم می تواند با مجموعه کوچکی از نمونه های آموزشی یادگیری داشته باشد و داده های آموزشی خود را هر زمان که در دسترس باشند افزایش دهد. علی رغم مزایای الگوریتم نزدیکترین همسایه از قبیل سرعت بالا در زمان یادگیری و توانایی نمایش پیچیده ترین مرزهای تصمیم گیری، این روش دارای مشکلاتی مانند وابستگی کارآیی به معیار فاصله، نمونه های آموزشی نویزی و خصیصه های مورد استفاده می باشد. همچنین این الگوریتم از همه نمونه های آموزشی در زمان تصمیم گیری استفاده می کند که نتیجه آن، سرعت پایین دسته بندی و نیازمندی به حافظه زیاد است. این مشکل درمورد مجموعه داده های بزرگتر، ملموس تر است. در این رساله الگوریتمی معرفی شده است که به طور همزمان به دنبال یافتن یک مجموعه کاهش یافته از نمونه ها و تطبیق معیار فاصله با مسئله مورد حل، از طریق انتساب وزن به نمونه های منتخب می باشد. برای انتخاب نمونه ها یک الگوریتم خوشه بندی با ناظر و برای تطبیق معیار فاصله، الگوریتم یادگیری پیشنهاد شده است که سعی میکند با تنظیم وزن نمونه های منتخب، نرخ دسته بندی کنار گذاری تک به تک را ماکزیمم سازد. وزن یک نمونه برای محاسبه فاصله (و یا شباهت )آن نمونه آموزشی با نمونه مورد پرسش مورد استفاده قرار می گیرد.
منابع مشابه
ارائه راهکاری نوین برای بهبود الگوریتم های تکاملی چندهدفه مبتنی بر تجزیه
الگوریتم تکاملی چند هدفه مبتنی بر تجزیه (moea/d-de) یکی از الگوریتم های تکاملی است که به منظور برآورد نقاط بهینه پارتو با پیچیدگی کمتر محاسباتی در مسائل با ابعاد زیاد استفاده می شود. عملکرد الگوریتم moea/d-de به تنظیم مناسب پارامترهای کنترلی آن بستگی دارد و بهترین نحوه تنظیم این پارامترها تاثیر بسزای در افزایش توانایی و بهبود عملکرد آن دارد. یکی از این پارامترهای کنترلی ، پارامتر همسایگی می باش...
ارائه رویکردی نوین و خودکار به منظور تولید داده های تست مبتنی بر روشهای تصادفی
فرآیند تست 50% کل هزینه توسعه نرم افزار را شامل می شود. به منظور تست نرم افزار، باید مجموعه ای از دادههای تست ایجاد شوند که تولید این مجموعه، کاری بسیار زمانبر بوده و تاثیر مستقیمی بر هزینه فرآیند تست خواهد داشت. بدون خودکارسازی، این فرآیند، کند، پرهزینه و همراه با خطا خواهد بود. در این مقاله روش جدیدی به منظور تولید داده های تست بر مبنای الگوریتمهای تصادفی با ترکیب روشهای ایستا و پویا ارائه ش...
متن کاملیادگیری زدایی؛ راهکاری برای یادگیری بیشتر
مقدمه: به رغم آگاهی فزاینده در مورد اهمّیت و ضرورت یادگیری، چگونگی، اشکال آن و رویههایی که یادگیری را در افراد و سازمانها تشویق میکند، شناخت بسیار کمی درباره یادگیریزدایی وجود دارد. چیستی یادگیریزدایی، چرایی مهم آن و شرایطی که آن را ترغیب میکنند، کمتر مورد بحث قرار گرفتهاند. با توجه به اهمّیت یادگیریزدایی و نقش آن در فرآیند انتقال و اکتساب دانش، این مقاله به بررسی یادگیریزدایی، ضرورت و...
متن کاملارائه راهکاری جهت تجمیع داده ها در سازمانها با استفاده از وب سرویس
Increasing the speed and reducing the use of resources in the data integration process has always been the goal of developers and researchers in the process of data integration. The purpose of this study is to provide a solution using metadata as well as web browsing to speed up the process, so as to improve resources such as memory. The proposed solution is implemented using the three-layer ar...
متن کاملارائه مدل انتخاب برای حسابرسی مالیاتی مبتنی بر ریسک
چکیده انتخاب مؤدی بر اساس معیار ریسک و برنامهریزی حسابرسی، نیازمند شناسایی سطح ریسک هر مؤدی است و شناسایی ریسک هر مؤدی نیز مستلزم شناسایی عوامل مؤثر بر ریسک می باشد. در سازمان امور مالیاتی ایران، مدل کامل و جامعی جهت انتخاب مؤدیان بر پایه ارزیابی سطح ریسک و انتخاب مؤدی جهت حسابرسی وجود ندارد. در این تحقیق 15 متغیر مستقل به عنوان عوامل مؤثر بر ریسک تمکین اشخاص حقوقی شناسایی و در قالب 3 فرضیه ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023